Vous devez activer Javascript pour accéder à ce site
Accueil  / Semaine 3 / Autoévaluation

Autoévaluation

Question 1

Calculez la factorielle $ n !$ pour $ n=1,2,3,4,5,100$.

Question 2

Calculez $ {n \choose k}$ pour $ n=10$ et $ k=1,2,3,4$.

Calculez $ \sum_{k=1}^4 {n \choose k} k $

Question 3

Vous souhaitez accélérer le calcul des vues du type suivant dans une base de données relationnelles : « SELECT produit, sum(ventes) where country= ? ». Le paramètre « country » peut prendre différentes valeurs.

Vous disposez de 3 Mo de libre pour cette accélération. Comme il y a plus ou moins de produits mis en vente dans différents pays, la taille du résultat de la requête varie selon le pays.

Vous ne savez pas d’avance quels pays risquent d’intéresser l’analyste. Ainsi, vous supposez que tous les pays sont d’un intérêt égal, a priori.

Quelles requêtes devez-vous matérialiser, et pourquoi ?

 Italie (0,4 Mo)
 France (0,5 Mo)
 Canada (0,8 Mo)
 États-Unis (1,4 Mo)
 Sénégal (0,2 Mo)
 Brésil (0,3 Mo)
 Grande-Bretagne (0,4 Mo)
 Allemagne (1,3 Mo)

Question 4

On cherche à estimer la taille de la vue « SELECT produit,pays,sum(ventes) FROM table GROUP BY produit,pays » en nombre de lignes. À cette fin, on extrait un sous-ensemble de la table originale.

En utilisant un modèle statistique multifractal, estimez la taille de la vue.

Échantillon :

produit  pays fournisseur ventes
crayon Canada Bilboard 432
livre France Walmart 4235
vélo Canada VendTout 466
livre Allemagne VendTout 567
crayon France VendTout 887
vélo Canada Walmart 421
crayon Canada Walmart 14
livre France Zellers 566
vélo Canada VendTout 67
crayon Canada Zellers 89
crayon Canada Babo 19

En utilisant les conventions de l’article « Estimation statistique de la taille des vues », nous avons $ p=0.01$ et $ N=1100$ (resp. le ratio d’échantillonnage et le nombre de rangées).

Question 5

Nous avons vu dans les articles de cette semaine qu’en prenant le OU exclusif de plusieurs fonctions de hachage (une sur chaque colonne), on composait ainsi une fonction de hachage indépendante trois-à-trois. Est-ce que le même résultat serait vrai avec le OU logique régulier ? Que pouvez-vous dire du ET logique ?

Question 6

Soit la table suivante :

colonne 1 colonne 2
A Z
A Y
C Y
A Z
C W
A W
B Z

Soit les valeurs hachées suivantes :

A 000
B 110
C 010
W 111
Y 101
Z 011

En utilisant l’algorithme simple de Flajolet et Martin, estimez le nombre de rangées distinctes dans la table. Quelle est la valeur exacte ?


[1Attention ! Toujours prendre le logarithme en base 2.

[2La valeur $ {k\choose a}$ est le coefficient binomial.